[Day1] 對三分鐘熱度的人來說...

2025 iThome 鐵人賽

DAY 1

自我挑戰組

探索AI之旅系列第 1 篇

17th鐵人賽 #ai影像辨識 #azureai #攝影ai

Kai

2025-09-15 22:37:46

288 瀏覽

分享至

30天真的是一個超級大的自我挑戰啊~~~

思來想去，必須選擇自己有興趣的主題才有辦法堅持下去，接下來幾天，我將會寫攝影相關的AI知識，請多多指教~
BTW，我會比較偏向分享Azure的模組，因為我上的AI課就是在使用Azure!!

首先想分享Azure AI視覺分析(Azure AI Vision ImageAnalysis)，視覺分析目前在日常生活中運用非常廣泛，例如：車牌辨識、交通違規分析(路上一堆科技執法)、無人駕駛物體偵測、臉部辨識以及醫療影像辨識等。

接下來我將歸列出幾個比較常用到的參數以及呈現結果，引用套件的程式碼如下：

from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
# 建立影像分析物件
client = ImageAnalysisClient(endpoint, AzureKeyCredential(key))  # 別忘了放入自己的金鑰跟端點
result = client.analyze(image_bytes,
                        visual_features[VisualFeatures.CAPTION,
                                        VisualFeatures.TAGS,
                                        VisualFeatures.READ,
                                        VisualFeatures.OBJECTS,
                                        VisualFeatures.SMART_CROPS])

影像描述 CAPTION:分析圖片並產生一段文字描述圖片中的內容

補充:還有一個參數DENSE_CAPTIONS，可以針對多個物體進行影像描述
影像標籤 TAGS:分析圖片中的元素，例如：天空、藍色、白雲
文字偵測(OCR) READ:將圖檔中的文字轉成可編輯的文字
補充：光學字元辨識(Optical Character Recognition,OCR)，可以將影像、印刷、手寫的資料進行掃描後，轉換成可識別的電子文件，以便搜尋、編輯與儲存，LINE目前就有提供這個功能。
物體偵測 OBJECTS:偵測圖片中的物體
智慧裁切 SMART_CROPS:辨識出圖片適合的長寬比，可以搭配Pillow套件將圖片進行裁切